在许多现实世界应用中,可靠的概率估计在具有固有的不确定性的许多现实应用中至关重要,例如天气预报,医疗预后或自动车辆的碰撞避免。概率估计模型培训观察到的结果(例如,它是否已下雨,或者是否患者是否已死亡),因为感兴趣事件的地面真理概率通常是未知的。因此,问题类似于二进制分类,具有重要差异,即目标是估计概率而不是预测特定结果。这项工作的目标是使用深神经网络调查从高维数据的概率估计。存在几种方法来改善这些模型产生的概率,但它们主要专注于概率与模型不确定性相关的分类问题。在具有固有的不确定性问题的情况下,在没有访问地面概率的情况下评估性能有挑战性。要解决此问题,我们构建一个合成数据集以学习和比较不同的可计算度量。我们评估了合成数据以及三个现实世界概率估计任务的现有方法,所有这些方法都涉及固有的不确定性:从雷达图像的降水预测,从组织病理学图像预测癌症患者存活,并预测从Dashcam视频预测车祸。最后,我们还提出了一种使用神经网络的概率估计的新方法,该方法修改了培训过程,促进了与从数据计算的经验概率一致的输出概率。该方法优于模拟和真实数据上大多数度量的现有方法。
translated by 谷歌翻译
训练因果效果变分性自身摩托(CEVAE)以预测给定的观察治疗数据的结果,而使用重要性采样均匀的处理分布训练均匀治疗变分性自身培训(UTVAE)。在本文中,我们表明,通过减轻训练训练以测试时间发生的分布换档,使用对观察治疗分布的均匀处理导致更好的因果化推断。我们还探讨了统一和观察治疗分布的组合,推断和生成网络培训目标,以找到更好的培训程序,用于推断治疗效果。实验,我们发现所提出的Utvae在综合效应误差估计比Sycleiny和IHDP数据集上的CEVAE估计的估计是更好的绝对平均处理效果误差和精度。
translated by 谷歌翻译
适当的评估和实验设计对于经验科学是基础,尤其是在数据驱动领域。例如,由于语言的计算建模成功,研究成果对最终用户产生了越来越直接的影响。随着最终用户采用差距的减少,需求增加了,以确保研究社区和从业者开发的工具和模型可靠,可信赖,并且支持用户的目标。在该立场论文中,我们专注于评估视觉文本分析方法的问题。我们从可视化和自然语言处理社区中采用跨学科的角度,因为我们认为,视觉文本分析的设计和验证包括超越计算或视觉/交互方法的问题。我们确定了四个关键的挑战群,用于评估视觉文本分析方法(数据歧义,实验设计,用户信任和“大局”问题),并从跨学科的角度为研究机会提供建议。
translated by 谷歌翻译
脑电图(EEG)信号是用于癫痫发作分析的有效工具,其中最重要的挑战之一是对癫痫发作或发起的癫痫发作事件和大脑​​区域的准确检测。但是,所有基于机器学习的癫痫发作分析算法都需要访问标记的癫痫发作数据,同时获取标记的数据是非常劳动密集型,昂贵的,并且鉴于EEG信号的视觉定性解释的主观性质。在本文中,我们建议以自我监督的方式检测癫痫发道和剪辑,在这种方式中不需要访问癫痫发作数据。所提出的方法考虑了通过使用正和负子图的局部结构和上下文信息,这些信息嵌入了EEG图中。我们通过最大程度地减少对比度和生成性损失来训练我们的方法。当地脑电图子图的使用使该算法在访问所有脑电图通道时成为适当的选择,这是由于诸如颅骨骨折之类的并发症。我们对最大的癫痫发作数据集进行了一系列广泛的实验,并证明我们提出的框架在基于EEG的癫痫发作研究中优于最新方法。提出的方法是唯一需要在其训练阶段访问癫痫发作数据的研究,但可以建立一个新的领域最新技术,并且胜过所有相关的监督方法。
translated by 谷歌翻译
当RIS反射系数得到精确调整时,在可重新配置的智能表面(RISS)中的被动横向形成可以可行,有效的通信方式。在本文中,我们提出了一个框架,以从Terahertz(THZ)通信系统中的时间序列预测的角度进行深入学习,以跟踪RIS反射系数。所提出的框架对类似的学习驱动的框架实现了两步的增强。具体而言,在第一步中,我们训练液态机器(LSM)在先前的时间步长(称为时间序列序列)上跟踪历史RIS反射系数,并预测其即将到来的时间步骤。我们还通过Xavier初始化技术微调了训练的LSM,以降低预测方差,从而导致更高的预测准确性。在第二步中,我们使用集合学习技术,该技术利用多个LSM的预测能力来最大程度地减少预测差异并提高第一步的精度。从数值上证明,在第一步中,采用Xavier初始化技术来微调LSM最多的LSM预测差异最多可使LSM降低26%,并且在现有的对应物中提高了46%可实现的光谱效率(SE),当部署11x11的RIS时。在第二步中,在训练单个LSM的相同计算复杂性下,具有多个LSM的集合学习降低了单个LSM的预测差异高达66%,并最多可提高可实现的SE系统。
translated by 谷歌翻译
识别,跟踪和预测伤口愈合阶段的进展是正确诊断,有效治疗,促进愈合和减轻疼痛的基本任务。传统上,医学专家可能会观察到伤口,以确定当前的愈合状态并建议治疗。但是,可以通过视觉指标从视觉指标中产生此类诊断的专家可能会耗时且昂贵。此外,病变可能需要数周的时间才能进行康复过程,要求资源不断监测和诊断。自动执行此任务可能具有挑战性;遵循伤口从发作到成熟的伤口进展的数据集很小,很少,并且通常没有计算机视觉。为了应对这些挑战,我们引入了一种自我监督的学习计划,该计划由(a)学习伤口的时间动态的学习嵌入,(b)自动阶段发现的聚类以及(c)微调分类。拟议的自我监督和灵活的学习框架是在生物学上启发和培训的,并在人类标签为零的小数据集上进行了培训。 HealNet框架达到了高文本和下游分类精度。当对持有的测试数据进行评估时,HealNet获得了94.2%的文本准确性和93.8%的愈合阶段分类精度。
translated by 谷歌翻译
波斯语是一种拐点对象 - 动词语言。这一事实使波斯更不确定的语言。但是,使用诸如Zero-Width非加床(ZWNJ)识别,标点符号恢复和波斯ezafe施工的技术将导致我们更加可理解和精确的语言。在波斯的大部分作品中,这些技术是单独解决的。尽管如此,我们认为,对于波斯的文本细化,所有这些任务都是必要的。在这项工作中,我们提出了一个ViraPart框架,它在其核心中使用了嵌入式帕尔兹伯特进行文本澄清。首先,通过分类程序层用于分类过程的分类程序来使用BERT Variant。接下来,我们组合模型输出以输出ClearText。最后,ZWNJ识别,标点恢复和波斯EZAFE施工的提出模型分别执行96.90%,92.13%和98.50%的平均F1宏观分数。实验结果表明,我们的建议方法在波斯语的文本细化中非常有效。
translated by 谷歌翻译
半监督异常检测旨在使用在正常数据上培训的模型来检测来自正常样本的异常。随着近期深度学习的进步,研究人员设计了高效的深度异常检测方法。现有作品通常使用神经网络将数据映射到更具内容性的表示中,然后应用异常检测算法。在本文中,我们提出了一种方法,DASVDD,它共同学习AutoEncoder的参数,同时最小化其潜在表示上的封闭超球的音量。我们提出了一个异常的分数,它是自动化器的重建误差和距离潜在表示中封闭边距中心的距离的组合。尽量减少这种异常的分数辅助我们在培训期间学习正常课程的潜在分布。包括异常分数中的重建错误确保DESVDD不受常见的极度崩溃问题,因为DESVDD模型不会收敛到映射到潜在表示中的恒定点的常量点。几个基准数据集上的实验评估表明,该方法优于常用的最先进的异常检测算法,同时在不同的异常类中保持鲁棒性能。
translated by 谷歌翻译
Recent results indicate that the generic descriptors extracted from the convolutional neural networks are very powerful. This paper adds to the mounting evidence that this is indeed the case. We report on a series of experiments conducted for different recognition tasks using the publicly available code and model of the OverFeat network which was trained to perform object classification on ILSVRC13. We use features extracted from the OverFeat network as a generic image representation to tackle the diverse range of recognition tasks of object image classification, scene recognition, fine grained recognition, attribute detection and image retrieval applied to a diverse set of datasets. We selected these tasks and datasets as they gradually move further away from the original task and data the OverFeat network was trained to solve. Astonishingly, we report consistent superior results compared to the highly tuned state-of-the-art systems in all the visual classification tasks on various datasets. For instance retrieval it consistently outperforms low memory footprint methods except for sculptures dataset. The results are achieved using a linear SVM classifier (or L2 distance in case of retrieval) applied to a feature representation of size 4096 extracted from a layer in the net. The representations are further modified using simple augmentation techniques e.g. jittering. The results strongly suggest that features obtained from deep learning with convolutional nets should be the primary candidate in most visual recognition tasks.
translated by 谷歌翻译